داده کاوی مبتنی بر نظریه استنتاج تجربی

پایان نامه
چکیده

روش های الهام گرفته شده از طبیعت راه کار مناسبی برای حل مسائل پیچیده و پویا می باشند. در این رساله به طور خاص از نظریه استنتاج تجربی در داده کاوی الهام گرفته شده است. این نظریه بیانگر مکانیزم تفکر در انسان است و از معدود روش های برخورد نمادین با شبکه های عصبی می باشد. در این تحقیق، ابتدا دو سیستم توصیه گر جدید (‍crs و chrs)، برای بررسی کارایی این نظریه در داده کاوی، معرفی نموده ایم و در ادامه، روشهایی برای استخراج قوانین از داده های غیر پویا (الگوریتم carm و tcarm) و همچنین داده های جریانی (الگوریتم dcarm) پیشنهاد داده ایم. آزمایش ها نشان می دهند، crs و chrs، توانایی مقابله با مشکلاتی از قبیل خلوتی ماتریس رأی ها و شروع سرد را دارند و نسبت به روش پالایش گروهی مبتنی بر پیرسون کاراتر می باشند. هدف الگوریتم carm، کشف قوانین انجمنی بر اساس نظریه ی استنتاج تجربی می باشد. در نظریه موجود، دانش در شبکه ای از نرون ها ذخیره می شود، ‍carm با بهره گیری از معیار مستدل بودن، دانش را به صورت قوانین، از این شبکه استخراج می نماید. به علت استفاده از این معیار، carm تنها به یک گذر از داده نیاز داشته و همچنین امکان مقابله با مشکل اقلام کمیاب را نیز دارد. آزمایش های انجام شده بر روی داده های مصنوعی نشان می دهد، carm از نظر حافظه ی مصرفی و زمان اجرا بسیار کارا می باشد. علاوه بر این، برای بررسی کیفیت قوانین، از طبقه بندی مبتنی بر قوانین انجمنی استفاده شده است. نتایج آزمایش ها بر روی داده های واقعی نشان می دهد carm توانایی کشف قوانین برای داده های کمیاب را دارا می باشد. carm برای کنترل تعداد قوانین از دو قید استفاده می کند قید اول مربوط به بخش مقدّم قوانین است و قید دوم مربوط به تالی یا همان معیار مستدل بودن است. به منظور بررسی کارایی قید اول، در هرس کردن قوانین غیر مفید، الگوریتم tcarm را معرفی نموده ایم که تنها با استفاده از معیار مستدل بودن قوانین را تولید می کند. اثبات شده است، قوانینی که در tcarm تولید می شوند، میزان مستدل بودن بیشتری نسبت به قوانین تولید نشده دارند. بررسی قوانین تولید شده توسط این دو الگوریتم، با استفاده از معیارهای مختلف، از جمله دقت، بازخوانی، پشتیبان و مستدل بودن نشان می دهد الگوریتم carm توانسته است به خوبی قوانین اضافی را هرس نماید. و در نهایت، الگوریتم dcarm را برای داده های جریانی معرفی نموده ایم که رفتار انسان را، در برخورد با داده ها در طول زمان، تقلید می کند. در این حالت با افزودن مفهوم فراموشی توانسته ایم مدیریت درستی برای کمرنگ شدن اطلاعات قدیمی تر داشته باشیم. از جنبه نظری اثبات شده است، dcarm در محیط های ایستا، به سمت carm همگرا خواهد شد. همچنین نشان داده شده است در محیط های غیر ایستا، امکان تشخیص تغییرات را دارد. علاوه بر این، آزمایشها نشان می دهد dcarm کارا بوده و توانایی مقابله با مشکل اقلام کمیاب را نیز دارد.

منابع مشابه

طراحی مدل هوشمند تناسب شغل و شاغل مبتنی بر استعدادها با رویکرد داده کاوی ‏

این پژوهش، در سه فاز اجرا شده است. در فاز اول، مفهوم استعداد مورد مطالعه ‏قرار گرفته و استعداد از 4 ‏منظر الگوهای تکرار شونده افکار، رفتار و احساسات، دانش، تجربه و ویژگی ‏های فردی، جهت اولویت ‏بندی و سنجش انتخاب شده اند. برای اولویت بندی معیارها از 22 نفر ‏خبرگان مرکز آمار ایران، نظر سنجی ‏شده و اوزان معیارها با روش آنتروپی شانون محاسبه گردید. ‏در فاز دوم، بر اساس اوزان معیارها، درجه ‏تناسب شغل...

متن کامل

طراحی یک متدولوژی مبتنی بر RFM جهت سنجش وفاداری مشتری با استفاده از تکنیک‌های داده کاوی

This study has proposed a new procedure, based on expanded RFM model, determining weight of parameters with pair-wise comparison matrix, clustering the products with K-optimum according to Davies-Bouldin Index, and then classifying customer product loyalty under B2B concept. It is necessary for firms to understand the customers and predict their needs for more success in business. The developed...

متن کامل

رویکرد مبتنی بر داده کاوی در مدیریت ارتباط با مشتری و بازاریابی

حضور در بازار پرتلاطم رقابت، سازما نها را به استفاده از رویکردهای نوین جهت نگهداشت مشتریان جاری، شناسایی و جذب مشتریان جدید سوق داده است. رو شهای داد هکاوی که قابلیت کشف دانش از انبوه داد هها را فراهم م یکنند، در این موضوع به کمک سازما نها آمده و آنها را در راستای رسیدن به اهداف بازاریابی و مدیریت ارتباط با مشتری 2 شامل شناسایی، جذب، نگهداشت و ارتقای مشتری یاری م یرسانند. در این مقاله، پس از مع...

متن کامل

داده کاوی احتمال وقوع خشک‌سالی در ایران

خشکسالی در سال‌های اخیر خسارات زیادی به کشور وارد ساخته است که باید تلاش کرد تا با استفاده از مدیریت منطقی، حتی‌الامکان خسارات ناشی از آن را کاهش داد. بدین منظور لازم است تا مناطق متأثر از این بلا مقایسه شوند و در اولویت اقدامات مدیریتی قرار گیرند. هدف از انجام این مطالعه تهیه نقشه شاخص خطر خشکسالی ایران است. در این تحقیق داده‌های بارش ماهانه 46 ایستگاه انتخاب شدند. به‌منظور تهیه نقشه شاخص DHI ...

متن کامل

بررسی کاربردهای داده کاوی در نظام سلامت

Introduction: Extensive amounts of data stored in medical databases require the development of specialized tools for accessing the data, data analysis, knowledge discovery, and the effective use of the data. Data mining is one of the most important methods. The article sketches the used Data Mining techniques, and illustrates their applicability to medical diagnostic and prognostic problems. ...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023